@来雨轩等:《基于大语言模型与检索增强的学科试题生成方法》

总结📔

研究方法就是提示词+RAG,似乎没啥新的,似乎在应用层的产品已经有很多了。(注意对于大模型生成结果格式不对的情况,本文采用了重新提问的方式)
写成论文就要注意:方法的评估,即证明这个方法是有效的,一般思路就是找基线模型对比,然后人工评估+自动评估。并且要定量+定性(对错多少,对错在哪里并举例)
分析部分延伸探讨了一些小问题,也是可扩展的方向。

摘要

1. 引言

2. 相关工作

2.1 问题生成

2.2 大语言模型赋能教育

3. 本文方法

3.1 任务定义

3.2 方法框架

3.3 基于大模型的格式解析器

3.4 教材检索

3.5 问题生成提问设计

4. 实验

4.1 实验设置

4.2 基于大语言模型的基线模型

4.3 生成问题的可用性

4.4 对比经典问题生成方法

4.5 案例研究

4.6 分析

5. 总结与展望